Return

World Happiness Index - EDA and Clustering

Este notebook es un breve análisis exploratorio del Índice de Felicidad Mundial para intentar comprender como ha sido su comportado en el tiempo, cuales son las diferencias que existen entre regiones y cuales son los determinantes que hacen a una Nación feliz. Se hará un especial énfasis en Colombia.

Para este análisis se usará la base de datos del World Index Report del año 2021 y otra con la información histórica del mismo.

World Happiness Report Official Website: https://worldhappiness.report/

Importación de librerías necesarias

Carga de información

Exploración de Dataframes

El Índice más alto registrado es de 7.8, el más bajo es de 2.52.

Análisis Gráfico

Mapa Mundial

Primero, graficaremos un mapa mundial para dar un primer vistazo a la distribución global del Índice.

El mapa nos evidencia unas claras diferencias entre continentes. África y Asia son las regiones con los menores índices, mientras que Europa y Norteamérica registran los más altos. Los puntajes de los países en cada continente son algo consistentes entre ellos, podemos observar 'continentes felices' y otros 'tristes' o menos felices.

Índice de Felicidad por Región

Las regiones que registraron un índice de felicidad más alto son Norte América y Europa Occidental, los más bajos están en África Subsahariana y el sur de Asia. Los intervalos de confianza nos permiten visualizar que casi la totalidad de los países de Latino América y el Caribe registran índices por encima de la media mundial.

¿Cuáles son los países más felices y más tristes?

Aunque las regiones con los índices promedio más bajos y altos registrados en el año 2021 son Sur Asia y Norte América, los países que encabezan la lista son mayormente europeos, mientras que en la parte baja la representación es mayormente del continente africano.

Colombia se encuentra en el Rankin 52, con un puntaje por encima de la media mundial.

Los países de América del Norte y Europa occidental son felices, los de Asia del sur son "tristes", ¿qué pasa con los países de las regiones intermedias?

¿Cómo se relaciona el Índice de Felicidad con las métricas que lo componen?

Las variables que tienen una importancia estimada y se encuentran más correlacionadas con El Índice de felicidad son el ingreso per cápita, la expectativa de vida y el apoyo social. La generosidad no pareciera tener relevancia.

Happines Score, Life Expectancy and GDP

Podemos ver una fuerte relación lineal entre el índice de felicidad, la expectativa de vida y el ingreso perca pita. Los países más felices, son aquellos más ricos y que presentan una expectativa de vida mayor.

Los países latinoamericanos y del Caribe se posicionan en su mayoría, por encima de la media mundial. Colombia ocupa una posición intermedia comparado con sus vecinos.

Corruption, Social Support and Happines Index

Con una excepción (Rwanda), los países con una baja percepción en la corrupción, presentan los niveles más altos de apoyo social y son a su vez, los más felices. Los más tristes tienen bajos niveles de apoyo social y una alta percepción de corrupción.

Colombia es uno de los países de Latinoamérica con mayor percepción de corrupción.

Freedom to Make Choices, Social Support and Happines Index

Podemos ver una fuerte relación lineal entre el índice de felicidad (Tamaño del circulo), el apoyo social y la libertad para tomar decisiones, los países más felices son aquellos con estas dos métricas altas.

Las métricas de apoyo social y libertad para tomar decisiones de vida en Colombia se encuentran por encima de la media mundial, esto se repite para cada uno de las métricas que componen al Índice.

Comportamiento del índice en el tiempo

Año 2021, un periodo de retroceso.

El índice global de felicidad, el cual venía en ascenso los últimos años, tuvo un retroceso en el año 2021, esto probablemente como consecuencia de la Pandemia del COVID-19. Parece ser que tardó casi dos años desde su aparición en causar los mayores efectos negativos sobre la felicidad de la población mundial.

La ampliación del intervalo de confianza en el último año, sugiere que la afectación fue dispar a lo largo de la muestra de países, unos países alcanzaron niveles más altos de felicidad, mientras que otros sufrieron fuertes caídas. Estos último jalonaron la media hacía abajo.

El 51.7% de los países alcanzaron un nivel de felicidad menor en el año 2021 comparado con el 2019. El 41.6% mejoraron su medición y el 6.7% se mantuvo en el mismo nivel.

Comportamiento de las métricas del WHR en el tiempo

A pesar de la pandemia, todas las métricas que componen al índice son mejores que hace diez años

Si comparamos la media los años 2020 y 2021, podemos observar una caída en cada uno de las métricas asociadas al índice de felicidad.

Sin embargo, si miramos el espacio temporal de los últimos diez años entre 2011 y 2021, las métricas han mejorado (la mejora en la percepción de la corrupción está representada en un descenso de su métrica), esto parece indicarnos que, a pesar de las afectaciones negativas provocadas por la pandemia, en la actualidad hay mayores niveles de renta per cápita, apoyo social, expectativa de vida, libertad de tomar decisiones, generosidad y mejor percepción frente a la corrupción que hace diez años.

Países más felices y más tristes a través del tiempo

Si observamos a los diez países que históricamente han tenido los índices de felicidad más altos, podemos notar que suelen ser consistentes en el tiempo, aunque se encuentran cerca de los niveles más bajos que han registrado desde el año 2007, no difieren mucho de su puntuación media, a excepción de Canadá que se encuentra por debajo y Finlandia, la cual presentó uno de sus índices más altos registrados anteriormente.

Los países con índices más bajos en el tiempo tienen más variabilidad en sus resultados. Afganistán es el país con la peor puntuación, la segunda más bajas registrada desde el 2007, solo por encima de su propia puntuación registrada durante otro año.

Desde el año 2007, los países de la parte baja de la tabla son mayormente africanos, mientras que los de la parte alta son Europeos de nuevo, esto nos muestra que los resultados del 2021 vistos anteriormente, más que circunstanciales, parecieran adaptarse a un patrón en el tiempo.

Colombia también se muestra consistente en el tiempo, llama la atención que el año 2021 presentó una de las mediciones más bajas que ha registrado.

¿Cuantos países han ocupado los primero y últimos 3 puestos?

Desde el año 2005, solo 11 países diferentes han ocupado el top 3 de la clasificación, lo que sugiere una concentración en la cima. 22 países han ocupado los tres puestos más bajos.

¿Qué pasa con las regiones?

Comparado con el año 2011, las regiones que hoy son más felices son Europa, África Subsahariana y los Estados Independientes, estos últimos han registrado las alzas más altas (7.4%). El resto de regiones ha disminuido su puntuación, incluso Norte América, no obstante, permanece en el primer lugar.

Latino América y el Caribe han disminuido su registro un -2.3% respecto a hace diez años. Llama la atención que este descenso es generado por la caída en los países de América del Sur, mientras que los países del Caribe han incrementado su puntuación. El país más feliz de la región en el año 2021 es Costa Rica.

Colombia en el tiempo

Los países más felices parecen mantenerse en el tiempo, mientras que los de índices más bajos, pareciera que están peor.

Esta grafica nos confirma de nuevo que Colombia se encuentra en uno de los niveles más bajos de los últimos años.

Comparación Colombia vs primero y último

Colombia se encuentra por debajo de Finlandia y por encima de Afganistán en cada una de las métricas del Índice, a excepción de la métrica de generosidad, la cual, tras estar históricamente por debajo de estos dos países, en el 2020 repuntó y se situó por encima de Finlandia.

Colombia se encuentra por debajo de Finlandia y por encima de Afganistán en cada una de las métricas del Índice, a excepción de la métrica de generosidad, la cual, tras estar históricamente por debajo de estos dos países, en el 2020 repuntó y se situó por encima de Finlandia.

Clustering

Finalmente, aplicaré el modelo K-means de clustering para encontrar grupos de países con características similares entre si.

Los clústeres se definen como grupos de objetos de datos que son más similares a otros objetos en su clúster que a objetos de datos en otros clústeres.

La agrupación en clústeres es un conjunto de técnicas utilizadas para particionar datos en grupos o clústeres. Es el proceso de división del conjunto de datos en grupos en los que los miembros del mismo grupo poseen características similares. El objetivo de K-means es simple: agrupar puntos de datos similares y descubrir patrones subyacentes.

Para seleccionar el número de clústers usaré el Método del Codo.

Seleccionaré k=3 clusters para correr el modelo. Esto clasificará en tres grupos, de acuerdo a patrones en común que existen en sus métricas, a los países reportados.

Conclusiones

Colombia.